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菊 叶 香 蔡 转录 组 数据 库 中 FPPS 基因 的 
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摘要 : 菊 叶 香 理 精油 具有 潜在 的 药 用 价值 ， 富 含 倍 半 昔 类 化 合 物 ， 其 生物 合成 分 支点 的 关键 
酶 为 法 尼 基 焦 磷 酸 合 酶 (FPPS)。 为 了 深入 了 解 菊 叶 香 莹 法 尼 基 焦 磷 酸 合 酶 基因 ， 本 研究 对 菊 
叶 香 蔡 转 录 组 数据 库 进 行 挖掘 ， 获 取 了 两 条 FPPS 基因 序列 (DsFPPS1 和 DsFPPS2)， 并 对 
DsFPPS1 和 DsFPPS2 编码 和 蛋白 的 理化 性 质 、 结 构 、 功 能 、 系 统 进化 进行 了 分 析 。 结 果 表 明 ， 
DsFPPS1 和 DsFPPS2 基因 分 别 包 含 1029 bp 和 969 bp 的 开放 阅读 框 ， 分 别 编码 342 个 
(DsFPPS1) 和 322 个 (DsFPPS2) 氨 基 酸 。DsFPPS1 和 DsFPPS2 位 于 线粒体 内 ， 未 发 现 信 号 上 肽 
和 跨 膜 结构 ，DsFPPS1 为 稳定 和 蛋白， DsFPPS2 为 不 稳定 蛋白 ,氨基酸 序 列 比 对 发 现 DsFPPS1 
和 DsFPPS2 序列 相似 性 为 60.53%， 均 含有 5 个 保守 结构 域 和 2 ХАНЫ ЕХ. 

DsFPPS1 和 DsFPPS2 二 级 结构 主要 由 o- 螺 旋 构 成 , 三 级 结构 为 由 8 个 o- 螺 旋 形 成 的 o- 螺 旋 束 ， 
但 DsFPPS2 的 三 级 结构 中 缺少 一 个 o- 螺 旋 A。 系 统 进 化 树 中 DsFPPS1 与 药 科 植物 聚 为 一 枝 ， 
与 芝 科 植物 遗传 距离 较 近 ， 而 DsFPPS2 单独 聚 为 一 枝 。 本 研究 通过 对 菊 叶 香 殖 转录 组 数据 
库 中 FPPS 基因 的 挖掘 与 生物 信息 学 分 析 ， 为 菊 叶 香 芝 FPPS 的 功能 研究 及 其 倍 半 莫 类 化 合 
物 的 生物 合成 研究 黄 定 了 一 定 的 理论 基础 。 
关键 词 : 法 尼 基 焦 磷酸 合 酶 ， 转 录 组 ， 菊 叶 香 获 ， 基 因 挖 掘 ， 生 物 信 息 学 
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Abstract: Dysphania schraderiana, in the Chenopodiaceae family, is widely distributed in Lhasa 
(Tibet, China) and used as a traditional medicine. The essential oil of Dysphania schraderiana, 
which contains abundant sesquiterpenes compounds, appeared to possess potential medicinal 
value. Farnesyl pyrophosphate synthase (FPPS) is a key branch-point enzyme in biosynthesis of 
terpene. In order to reveal D. schraderiana FPPS gene, the transcriptome database of D. 
schraderiana was mined and two gene sequences (DsFPPS] and DsFPPS2) were obtained in this 
research. Subsequential protein physicochemical property, architectural feature, function and 
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phylogeny relationship analysis of DsFPPSs were also predicted апа analyzed. Тһе results 
indicated that DsFPPS1 and DsFPPS2 sequences contained an ORF span of 1029 bp and 969 bp 
respectively, encoding 342 (DsFPPS1) and 322 (DsFPPS2) amino acids respectively. The analysis 
of amino acid composition indicated that the dominant components of DsFPPS1 and DsFPPS2 аге 
both nonpolar amino acids. The molecular weight of DsFPPS1 and DsFPPS2 were 39.68 kD and 
36.76 kD, respectively. Isoelectric point were 5.11 and 5.65 for DsFPPSI апа DsFPPS2, 
respectively. Besides, DsFPPS1 protein was predicted to be a stable protein, but DsFPPS2 protein 
was predicted to be an unstable protein. The amino acid sequence analysis showed that DsFPPS1 
and DsFPPS2 had no signal peptide and transmembrane region. The possible localization of 
DSFPPS1 and DsFPPS2 was both in mitochondria. DsFPPS1 and DsFPPS2 protein exhibited 
60.53% sequence identity, and possessed five conserved domain ( I ~ V ) and two characteristic 
Asp-rich motifs (DDXXD). The amino acid sequence of DsFPPS1 has higher homology with 
Chenopodium quinoa, Spinacia oleracea and Beta vulgaris than DsFPPS2. In addition, the 
secondary structure of DsFPPS proteins mainly consisted of а-һейхев, which resulted іп а bundle 
of 8 a-helices in tertiary structure. However, tertiary structure analysis showed that DsFPPS2 
protein was missing ап a-helix compared to DsFPPS1 protein. The result of phylogenetic analysis 
indicated that phylogenetic relationships of DsFPPS1 protein were closer to Chenopodiaceae 
plants consistent with sequence alignment results, while DsFPPS2 protein was clustered alone in 
phylogenetic tree. In general, these results could lay a foundation for an insight to molecular 
function of DsFPPS and the synthetic biology of sesquiterpenes in D. schraderiana. 
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ЖІҢЯ (Dysphania schraderiana) 5 ЖЫН RE, а Л 20, RA FMEA, Ж. 
解 表 、 止 痛 、 止 痒 等 功效 ， 是 我 国 传统 的 药 用 植物 。 现 代 研 究 发 现 菊 叶 香 莹 精油 具有 广泛 的 
生物 活性 , 本 课题 组 在 前 期 的 研究 中 发 现 菊 叶 香 莹 精油 对 大 肠 杆菌 和 枯草 芽孢 杆菌 的 生长 县 
显著 的 抑制 作用 , 并且 呈现 出 一 定 的 浓度 依赖 性 ; 此 外 有 研究 发 现 菊 叶 香 莹 精油 可 浓度 依 
赖 性 地 抑制 昆虫 玉米 象 的 活力 (雷鸣 , 2015); 现 已 有 利用 菊 叶 香 蔡 精油 治理 植物 螨虫 的 专利 
( 刘 志 龙 ,2015)。 本 课题 组 前 期 研究 中 利用 GC-MS 检测 了 菊 叶 香 蔡 精油 的 化 学 成 分 进行 了 检 
测 ， 除 了 精油 中 大 量 的 脂肪 族 化 合 物 (54.232 % 以 外 ， 倍 半 芷 类 化 合 物 占 有 较 大 的 比例 
(26.846%). 
ерен 2 ЯН 15 个 碳 原子 的 天 然 化 合 物 ， 即 包含 有 3 个 异 成 二 烯 单元 ， 具 有 多 
种 结构 类 型 ， 是 新 药 研 发 的 主要 来 源 之 一 ( 王 佳 , 2012)。 植 物 莫 类 化 合 物 主要 是 由 细胞 质 
的 甲 羧 成 酸 (MVA) 途 径 和 质 体 中 的 2-C- 甲 基 -D- 赤 从 糖 醇 -4- 磷 酸 (MEP) 途 径 合 成 ， 这 两 条 途 
径 生 成 病 类 化 合 物 的 共同 前 体 异 成 烯 焦 磷 酸 (isopentenyl pyrophosphate, IPP) 和 二 甲 基 丙烯 基 
二 人 磅 酸 (dimethylallylpyrophosphate，DMAPP)， 随 后 一 分 子 的 IPP 和 一 分 子 的 DMAPP 结合 
生成 香 叶 基 二 磷酸 (geranyl diphosphate，GPP)， 一 分 子 的 GPP 和 一 分 子 的 IPP 在 法 尼 基 焦 磷 
发 合 酶 (farnesyl diphosphate synthase, FPPS) 的 作用 下 生成 倍 半音 类 化 合 物 的 前 体 物 质 法 尼 基 
ЕЙ (Ғагпевуі diphosphate, FPP), FPP 再 在 多 种 倍 半 昔 合 酶 的 作用 下 生成 结构 多 样 的 倍 半 
泵 化 合 物 ( 孙 丽 超 , 2017)。 

植物 FPPS 由 基因 家 族 编码 ， 通 常 有 多 个 FPPS 亚 型 ， 例 如 拟 南 芥 含有 FPPSI ЖІ ЕРР52 
两 个 基因 ， 编 码 3 个 FPPS 亚 型 ， FPPS1S、FPPS1L 和 FPPS2， 同 时 敲 除 两 条 FPPS 基因 会 
造成 植物 死亡 , 单个 基因 敲 除 不 会 对 植物 的 生长 发 育 造 成 影响 , 因此 这 种 多 基因 模式 可 保证 
某 一 基因 受 损 时 植物 仍 能 正常 生存 , 但 不 同 的 亚 型 仍然 具有 不 同 的 表达 模式 与 活性 , АНЕ 


г. 


rE S 


FPS1 存在 于 植物 整个 生命 周期 ，FPS2 则 主要 在 种 子 生长 发 育 阶段 发 挥 作用 (Closa, 2010), 
Н. FPS2 具有 更 强 的 催化 活性 和 热 稳 定性 ， 对 氧化 钠 的 抑制 作用 也 更 敏感 Keim, 2012). 
FPPS 是 蔽 类 化 合 物 生物 合成 分 支点 的 关键 酶 ， 众 化 生成 重要 的 中 间 产 物 FPP 进而 合成 
倍 半 昔 类 化 合 物 。 鉴 于 FPPS 在 倍 半 熙 类 化 合 物 生 物 合成 途径 中 的 重要 性 ， 而 目前 尚未 见 菊 
HAER FPPS 基因 的 研究 报道 ， 因 此 ， 为 了 深入 探讨 菊 叶 香 蒙 的 FPPS， 本 研究 对 菊 叶 香 莹 
花 和 叶 转 录 组 数据 库 进行 挖掘 以 获取 菊 叶 香 芝 FPPS (DsFPPS) 基 因 , 并 利用 生物 信息 学 的 方 
法 对 该 基因 所 编码 蛋白 的 理化 性 质 、 亚 细胞 定位 、 结 构 特 征 、 功 能 以 及 系统 进化 方面 进行 分 
析 和 预测 ， 为 今后 深入 研究 该 酶 的 结构 和 功能 奠定 理论 基础 。 


1. 材料 与 方法 


1.1 材料 

菊 叶 香 莹 的 两 条 FPPS 基因 来 自 于 实验 室 前 期 菊 叶 香 蔡 转录 组 研究 ， 花 组 织 转录 组 与 叶 
组 织 转录 组 在 SRA (Sequence Read Archive) 数 据 库 中 的 登录 号 分 别 为 SRX3145242 和 
SRX3145241, 其 余 物种 相关 的 FPPS 蛋白 序列 均 来 自 NCBI (National Center for Biotechnology 
Information) 数据 库 ， 物 种 及 序列 信息 如 下 : % 3 Chenopodium quinoa (CqFPPS: 
ХР 021740746.1). 2%. Spinacia oleracea (SoFPPS: ХР 0218468811). ІШ 3% Beta vulgaris 
(ВуЕРР5: XP_010675977.1)、 野 茶树 Camellia sinensis (CSFPPS: ANA11766.1)、 柱 果 Mangifera 
indica (MiFPPS: АЕЈ52720.1). ЕЙ Ricinus communis (RcFPPS: AMN82836.1)、 橡 胶 树 Hevea 
brasiliensis (HbFPPS: ANJ77846.1)、 大 戟 Euphorbia pekinensis (EpFPPS: ACN63187.1)、 人 参 
Panax ginseng (PgFPPS: AAY87903.1)、 竹 节 参 Panax japonicas (PjFPPS: AKN52395.1)、 三 七 
Panax notoginseng (PnFPPS: А65792281). ЖЖЕЙЕ Hedera helix (HhFPPS: АРУ45530.1). Ч 
ТЕ Z° Panax quinquefolius (PqFPPS: ADJ68004.1) ~ 1 f Mentha x piperita (MpFPPS: 
AAK63847.1) 、 撒 尔 维 亚 Salvia officinalis Linn (SolFPPS: AQY54371.0) 、 丹 参 Salvia 
miltiorrhiza (SmFPPS: АВУ0881901). 2 HF Ж Ж 8 Lavandula angustifolia (LaFPPS: 
AGQ04160.1) 、 米 团 花 Leucosceptrum canum (LcFPPS: ALT07952.1) 、 黄 ÉS Astragalus 
membranaceus (AmFPPS: AID51444.1)、 甘 草 Glycyrrhiza uralensis (GuFPPS: АрЕ18770.1). 
2 E ta (MsFPPS: ADC32809.1HD)、 里 氏 木 霉菌 Trichoderma reesei (TrFPPS: AFX82678.1)、 新 月 
0 7 Ё Еттопѕіа crescens (ЕсЕРР5: POS87336.1) . Hh X z ftJ FF. В Emmonsia crescens 
(BIFPPS: ARC74194.1). ЛЕ  ІҮЯ Rhodobacter capsulatus (RHcFPPS: ADE44162.1). + Bos 
Taurus (BtFPPS: AAL58886.1)、 黑 猩猩 Pan troglodytes (PtFPPS: JAA28793.1)。 
1.2 分 析 方 法 
1.2.1 蛋白 基本 性 质 分 析 
F Jj j jk JE (ORF) 通过 GenBank 的 在 线 软 件 ORF Finder 
(https://www.ncbi.nim.nih.gov/orffinder/) 进 行 查找 。 获 取 基 因 所 编码 的 蛋白 质 氨 基 酸 序列 后 ， 
运用 多 种 在 线 软 件 分 析 、 预 测 和 蛋白 的 相关 信息 : 蛋白 的 理化 性 质 利用 ProtParam 
(http://web.expasy.org/protparam/) 进 行 分 析 ; ЖЕ BJ E/K EE Zy Br JV H E Zk EAF ProtScale 
(http://web.expasy.org/protscale/) ; Ж А 0 (5 5 ika 07 V Н # 46 T. А SignalP 4.1 
(http://www.cbs.dtu.dk/services/SignalP/); 蛋白 的 跨 膜 结构 域 预测 应 用 在 线程 序 TMHMM 
(http://www.cbs.dtu.dk/services/TMHMM/); 蛋白 的 亚 细 胞 定位 预测 运用 在 线 软件 Cell-PLoc 
2.0 (http:/www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)。 
1.2.2 蛋白 结构 特征 与 功能 分 析 

Ж н Ж 的 二 级 ы а 用 在 R SOPMA 
(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html) 软 件 进行 预测 ， 重 白 
质 的 三 级 结构 运用 Phyre2 (http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index) 在 线 软 
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件 进行 预测 ; 利用 在 线 数 据 库 CDD (Conserved Domain Database) 


(https://www.ncbi.nlIm.nih.gov/cdd/) 进 行 保守 位 点 分 析 。 
123 和 蛋白 氨基 酸 序 列 比 对 以 及 系统 进化 树 构建 


运用 NCBI 中 的 BLASTP (https://blast.ncbi.nlm.nih.gov/Blast.cgi) 模 块 进行 不 同 物种 FPPS 
氨基 酸 序列 的 在 线 搜索 ， 运 用 ClustalW 进行 多 条 FPPS 氨基 酸 序 列 比 对 。 采 用 邻接 法 
(Neighbor-Joining) 构 建 FPPS 氨基 酸 序 列 的 系统 进化 树 , 使 用 自 展 值 (Bootstrap) 重 复 检验 1000 


次 ， 系 统 进 化 树 的 构建 和 检验 通过 本 地 软件 MEGA 7.0.14 实施 。 
2. 结果 与 分 析 
2.1 ЖІҢДЕЗІ FPPS 基因 挖掘 


通过 对 菊 叶 香 蔡 转录 组 数据 中 核酸 序列 进行 比 对 和 功能 注释 , 挖掘 得 到 两 条 编号 分 别 为 


с13053 в1 和 c12747_g1 的 FPPS 候选 基因 ,分 别 重 命名 为 DsFPPS1 和 DsFPPS2, DsFPPS1 


长 度 为 1257 bp， 其 互补 链 转录 翻译 为 FPPS 和 蛋白， 开放 阅读 框 为 1 029 bp， 开 放 阅 


读 框 对 


应 到 DsFPPS1 的 位 置 为 1 185~155 bp， 编 码 342 个 氨基 酸 ， 编 码 蛋 白 命 名 为 DsFPPS1; 


DsFPPS2 长 度 为 1667bp， 包 含 一 个 969 bp 的 开放 阅读 框 ， 位 置 从 296~1 264 bp， 编 码 322 


个 氨基 酸 ， 编 码 和 蛋白 命名 为 DsFPPS2( 图 1). 


201808.00139у1 
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ТСТССТТСОССАСТАСААТАСАТСАТТСАТСААТАТААССТСТСТТТОСАСААААТТАААТТАСААААСССАССТАСАТА 


АСАСААСАААССАССТАСААААТАААТСААСАТСААТАСААААССААТСАААСААССССААААСАССААССАСТТСАСТТ 
ж K 


СТОССТСТТСТАААТТТТТСССААСААТСАСТТСАССАГАССТТСТАСТССТСТАСТАССАТСТСОСТТСААТАСАТТССА 
QB E A Tok A EFTS E bD LA a ASe g E ik p TEI 


TCAATTTTTCATAACTCTTGCTCTCATAATCGGCAAACGCAGCCTGAAGATTGAGTACATTGTAGAGTTCTTTAACTCTT 
E  ГҮНІТҮТСЕЕКУЕК 


СССАГАСААОСТОСОТСТТСТТТОССОТААТТТТСАТАТААСАСТТОСТТТТОТТСАТТОТТАСАААССТСТААСОСТТТ 
A. V Ü A.E D KE K.G Y N Ec Y L X 8 OR Ñ E NON C L E K K K 


ААСААССААССААСАССАСТТААААТСТТСААТАТСССТТССААТСТТОССААТАААТТСТОССТССССААААСААТССА 
Eo: E RR mn К Е ФЕ R ЛЕК Wa Е Е Bed: G Е Ср E 


САТААТСАТССТСТАСТТССАААТАТАТАСССАТАТСААТСААААТСТТТТТСАСАТССТСАТСАТСТТСААССТТСТСА 
和 Q YEE E £ СППТІ LIE E K FAE E ui TE L K +E 


CCAGACATAAGTAAAGCACAAGCTACAGAAATATAAAATGAGTAATAAGCAGTTTTGTACTGGACAATGCGACGGTGCAA 
C S N LoL k C kuy S T Y F S Y Y & T K Y Ü Y T RR H L 


АТССААССААТАТТТТСАААСАТСТТТСТСТССТТССАТССТАСТСАТСАССТСААТСАТСТСТССАСТСССАСТСТСАА 
DLEE S; $ ;ESS B D Сб EIE F I D I M 0 Сс5 Ж Teg E 


АТТСТАССТСАТТАААСАААТССААСААСТСААСАТАСТАСТТСТТОССССТААААТССТТССТСАСААТТСТАСССАТТ 
E E ШЕЛЕК G BR Jb ÉE Е LALE È 


ТОСТТТССААСТАТТАТАССАТССТТААСАССААТСААСССААССТТАССААСТСТАААССАССААСССТСАССАСОССТ 
ЕНЕНЕГТІСІПЕТУАЛ ГСУЕРҰК ҒҰҒСРОСЕВК 


ТОТАТСАСАСТТАТССАТСАТОТСАТСААСААСААСААААТАТОСТТОААОССАТТСААТОСАССАССССАОТОСАСААС 
ТНЗЕЗЛІШІГУҮІБР ТІ ІЛЕ TS EC G LK АЗА 


ССАСАААСАТТТСАТСАТСАСТСАССТСТТССССТТССТТТААСАССТТСТААСТСТСААТААСАСАААССССАССАТТТ 
ІЕІТІЕ(ЕТПТТІГ ЕЕ СЕ КЕ LRE T SCOE СЕН 


АССТТСССТССАССААСАТТСТААТССАССАТССССТСААСССАТТСАССАСААСТСТСССТССАТТСААААССАСССТС 
L E G СО V: N 3 ГЕ ЕКОБЕҮЛ АК S T W E СЕА Р D 


АТТААСААССТСАСАТТТСАСААСТТССТАААСТТСААССААСТТТСАТСТСАСАТСССТСАТТСТТТТТТСТТТТТСТТ 
Nl GB SR LF K S ROE DP S T 


ТТТАТТТТТАТТТТТСТТААСАСАТТСААСАСАСТААСААСТСАСАСТАТССАСААС 
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1 1 21 31 41 Бі 61 ?1 
AICGAGCTTTGAGTTGTCGGCTTGTTAACTTAATGGGTCGAGTTCAATTTTGAGTCGAGTTCAATCTTGAGTCGAGCCCA 


ТТСТАСТСАААСТТТСАТССАСТССАСТТТСААТААСТССТСАСТАССТСААТТСАТААССАССССТАССТТССАСААТТ 
ТАСССАСТТСААААССТААТТТТТСССАААТССТААСАСАТСАСААСАТССАСССАТСАААССАТСССАСАСАААСАТТТ 


АТССААСТАТАТАСАСТССТСААСАСССАСТТССТССААСАТССССССТТТСАССАТСАССАТСТСТССССТСАСТСССТ 
М T N S F VS G 


СААССАСАТССТССАТТАСААТСТТССАССАССТТССТТСТАСАСТСТСААСААААСТСААТАССССАТТСТСССТТАТТ 
= ТЕСЕ Т МЕЕ Q: E ЕК S Т Ess R ETD Е GLS УЧ 


САСАССТССААСТТАТТАААТСАТСССАААСААСТСАСТСААСАТСААСТТТТТСССССТТСТОСТСТТСССТССТССАТ 
Eel G 8 L. SPS: HMH m ASR E L QPB Wi: Q LEEA CA E G REC I 


CCAATGGCTCGTGGGATGCGTTCTTGTTCTGGATGATCTTTTGGATGCTTCTCACACCCGCCGCGGCCGCCCTTGTTGGT 
UEY G EUSE 3 s D: D: L L. D: K S WO R R UR FE C 3 


TTAGATTGCCTAAGGTTGGCATGATCGCTGTCAATGATGGCATTTTACTCTGGAATCATATCCACAGGATTCTTAGGAAA 
EE EE PR ER MD RY ED ee IDE E FHT HEETE R: K 


САСТТТАСАСААСАСССТТАСТАТСТССАТСТССТССАТТТАТТСААТСАССТТСААТТТСАААСАССТТСТССАСАААТ 
НЕКЕШПЕТТРГГЦІЕТІГЕИІШ Ү ЕЕ ПВ EC GEN 


САТТСАТСТСТТААСТССАТТССАСССССАСААТСАТТТСТТСАААТТТАСТССТОСССТССАССААТССАТСАСССАСТ 
E Ds hk A E ЕКЕ ТІКЕН ЕЗГІ 5 8 


АСААСАСТОСАТАТОСААСАТТТТАТСТСССТТТТОСАТОТОСТСТОСТСАТАТТАСОТСАСААСОСТОСАТСАТТАСААТ 
СЕЛ КОГСТТГКЕТКЫЕЕ ЕГЕ EET ELETI E Е 


GATGTGAAGGACATCCTTCTTGGGATGGGCATCTACTTCCAAGCACAGGATGATTATTTAGACTGCTTTGGAGATCCTAA 
СЕКІІЕ ЕСИНЕ EE Pr K Ó ED E L rE E G ШРК 


AAAGAGTGGCAAGATTGGATCAGACATTGAAGACTTCAAGTGTTCTTGGTTGGTAGTGAAAGCTTTAGAAGTCTGCAGTG 
É 596 R I GSS Ho T THEE EGS БЫ УУ КА Л у С 5 


АССАССАСААСАААСТСТТАТСТСАТААСТАТССТАААССАСАТССАССАААТСТТССССТАСТААААТСССТТТАТСАА 
ЕЕВЕКІГІСПНТСККЕ j) Puk N V K OE V. K SLE Y E 


САССТСААТСТТСАССССАТСТТТССТАААТАССАСАТТСАТСАСТАТСАСААСТТАТТАСТТАССАТТСААССТСТТСС 
E MN L RGS T ÉE КЕТЕГТПЕЛТЕКЕІЕІШУ-ГЕЖЕВЕ 


САССАААТСТОТОСААССАОТОСТСААСТСТТАГТТОООТААААТАТАСААСАСОСАСАААТАСОССООТТССТОТААСОО 
5 BES: ж 


АТАТТААТСТСАССААТТСТСАСТСТСТАСТСТСТААССТТСССТСТТТАССТСТСААСТССАССТСТСАСТТССАСАТА 
ТСТТССТСАСССССАССАААССАААСТСТТСАТТСАСТССТСААААТСТАТАСТСАТТСТАСССТОСТТССТСАСССААС 
ТТОТСАТАААТСААСТТССААААССССАААТАСТСТТТСАТАТССССТССАТСТТТТССТТАТТАТТАССАТТССАТСАА 
ААТТТСТСТТТСАТТТСАТСААССАССАСАТААААСААТААААААСААСАААСАСТСССААТААСАТАСАССАААСАТСА 


图 1 WHE DsFPPSI (A) 和 DsFPPS2 (B) 基 因 及 蛋白 序列 


Fig. 1 Тһе nucleotide sequence of DsFPPS1 (А) апа DsFPPS2 (В) gene апа their encoding 
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2.2 DsFPPS Ж 


Ha 


(222 CqFPPS; 
ЖНЕ ЖИН FPPS Ж 


白 的 到 


等 电 点 (pI 值 ) 在 5.01-5.12; 


13.8%~14.7%, 极 性 中 性 


E 化 性 质 分 析 
采用 在 线 软件 ProtParam 分 析 DsFPPS1 Ж 
JE SoFPPS; 甜菜 BvVFPPS) 的 到 


白 和 DsFPPS2 
化 性 


白 较 相似 ， 氨 基 酸 长 度 均 为 342 аа; 
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蛋白 以 及 3 Ж ЖИН ІН ЕРР5 
质 ， 结 果 如 表 1 所 示 。 
分 子 量 在 39.67~39.74 之 间 ; 

酸性 氨基 酸 比 例 在 15.5%~16.4% 之 间 ， 碱 性 氨基 酸 比 例 在 之 间 
氨基 酸 比 例 在 25.3%~26.5% 之 间 , 非 极 性 氨基 酸 比 例 在 42.4%-44.4% 


DsFPPS1 


之 间 ， 差 异 均 较 小 ; 不 稳定 系数 值 均 小 于 40， 属 于 稳定 蛋白 。 而 DsFPPS2 蛋白 与 DSFPPS1 
蛋白 以 及 将 科 植 物 FPPS 蛋白 差异 较 大 ， 氨 基 酸 个 数 为 322 aa， 长 度 短 于 其 他 FPPS ЖЕН; 
分 子 量 为 36.76; 等 电 点 (pI 值 ) 为 5.65; 碱 性 氨基 酸 和 极 性 中 性 氨基 酸 的 比例 与 其 他 FPPS 
蛋白 差异 较 小 ， 比 例 分 别 为 13.1% 和 27.3%， 而 酸性 氨基 酸 的 比例 低 于 其 他 FPPS ЖА, 
13.1%， 非 极 性 氨基 酸 的 比例 高 于 其 他 FPPS ЖА, 2 46.5%; 不 稳定 系数 值 大 于 40， 为 不 
ЖЕН. 
表 1 FPPS ЕНЯМЕЛЕЯ 
Table 1 The physicochemical properties of FPPS protein 
蛋白 名 ARR JTE FEA 酸性 碱 性 HERE ЗИЯТ 不 稳定 
称 个 数 (kDa) pl AER AER 氨基 酸 氨基 酸 系数 
Name Number MW (%) (%) (%) (%) Instability 
of amino acidic Alkaline Polar Nonpolar index 
acids amino amino neutral amino 
acid acid amino acid 
acid 
DsFPPS1 342 39.68 5.11 15.5 13.8 26.3 44.4 36.71 
DsFPPS2 322 36.76 5.65 13.1 13.1 27.3 46.5 41.58 
CqFPPS 342 39.74 5.01 16.1 13.8 25.3 44.8 35.71 
SoFPPS 342 39.74 5:12 16.4 14.7 26.5 42.4 28.58 
BvFPPS 342 39.67 5.07 15.8 13.8 26.2 44.2 38.20 


运用 在 线 软件 ProtScale 分 析 DsFPPS Ж 
ШЕШЕ ФЕТР 


性 用 分 值 表 示 ， 正 


DsFPPS1 蛋白 和 DsFPPS2 


蛋白 的 亲 / 朴 水 性 预 涡 
的 第 202 位 处 有 最 高 分 值 2.611， 表 明 其 疏水 铂 


蛋白 的 亲 / 玻 水 性 ， 重 白 的 每 一 位 氨基 酸 的 亲 / 朴 水 
负 值 则 表示 亲 水 ， 其 绝对 值 越 大 则 其 表示 亲 / 琉 水 性 越 强 ，。 

| 结 采 如 图 2 示 , 在 DsFPPS1 
FE 水 性 较 强 ;第 101 位 有 最 小 分 值 -2.733， 表 


ЖА] 


明 其 亲 水 性 较 强 ; 在 DsFPPS2 蛋白 氨基 酸 序 列 的 第 68 МЕН Н 2.800, BH ЖК 
性 水 性 较 强 ， 第 118 位 有 最 小 分 值 -2.578， 表 明 其 亲 水 性 较 强 。 


A 
3 


2 


1 


Hphob./Kyte & Doolittle 
疏水 性 /Kyte & Doolittie 算 法 一 一 


分 值 Score 
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Fig. 2 Hydrophilic-hydrophobic property prediction of DSFPPS1 (А) апа DsFPPS2 (В) protein 
2.3 DsFPPS 和 蛋白 的 信号 肽 、 跨 膜 结构 域 与 亚 细 胞 定位 分 析 
信号 肽 是 分 泌 蛋 白 NN 端 所 拥有 的 一 段 15~30 个 氨基 酸 残 基 的 短 肽 ， 在 分 泌 蛋 白 合成 结 
束 后 将 其 切除 , 因此 可 以 通过 分 析 和 蛋白 的 氨基 酸 序列 是 否 具 有 分 泌 肽 来 判断 蛋白 是 否 为 分 泥 
和 蛋白, 利用 在 线 软件 SignalP 4.1 对 DsFPPS 基因 所 编码 的 蛋白 进行 分 析 , 结果 显示 DsFPPS1 
蛋白 和 DsFPPS2 和 蛋白 均 不 具有 信号 肽 ， 属 于 非 分 泌 和 蛋白 (图 3A 和 3B)。 然 后 ， 我 们 利用 
ТМНММ 在 线 软件 分 析 DsFPPS 基因 编码 蛋白 的 跨 膜 结构 ， 结 果 显 示 DsFPPS1 和 蛋白 和 
DsFPPS2 蛋白 均 不 具有 跨 膜 结构 (图 4A 和 4B)。 此 外 ，Cell-PLoc 2.0 在 线 软件 的 亚 细 胞 定位 
分 析 表 明 ，DsFPPS1 蛋白 和 DsFPPS2 蛋白 均 存 在 于 细胞 的 线粒体 内 。 
А 


B 


C 值 C-score СВ С-ѕсоге 
12 - S 值 S-score 10 上 S 值 S-score 
Y 值 Y-score ҮЙ Y-score 一 一 


0.8 上 1 0.8 


分 值 Score 
° 
H 

分 值 Score 
о 
ы 


Г AA Ид 
ШІ ШШ з ИТТИ TTTTTTTTTTTTTT 
NMSDLRSKFL EVYQV LKSELLNDPAF BNT HT SRONV DRMLDYNYPGGKLNRGLSV IDSY KLLKEGEELTDO МТ MS PV ЗОЗТАСИ І TMFOEVRST LSRKLNRGLSV | ET CNLLNDA KOLT EDOLFRACAVGNC I QWLVGCV Ú 
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位 点 Position 位 点 Position 


图 3 DsFPPS1 蛋白 (A) 和 DsFPPS2 蛋白 (B) 的 信号 肽 分 析 
Бір. 3 Signal peptide prediction of DsFPPS1 (А) апа DsFPPS2 (В) protein 


А 
в 
ы нн ` 
=a 10 
Е È 
Z ов 跨 腊 Transmembrane “一 一 S ов = ' 
% 8 ытатетгапе ”一 -一 8 тапзпи s 
06 ËBB5FExtramembranous 8 06 BAlintramembrane —— 
H г. 52, branous —— 
Ë а 
Ë 04 32 0. 
局 
02 02 
° 一 ° Jammu === а” 
50 100 150 200 250 300 50 100 150 200 250 300 
位 点 Position 位 点 Position 


4 DsFPPS1 蛋白 (A) 和 DsFPPS2 蛋白 (B) 的 跨 膜 结构 域 分 析 

Бір. 4 Transmembrane helix regions prediction of DsFPPS1 (А) апа DsFPPS2 (В) protein 
2.4 DsFPPS 蛋白 的 功能 结构 域 分 析 

采用 NCBI 中 的 CDD 工具 、 本 地 软件 ClustalW 以 及 相关 文献 (Chen, 1994; Guo, 2015; 李 
永 波 , 2012) 寻 找 FPPS 蛋白 的 保守 结构 域 ， 结 果 显 示 FPPS 家 族 蛋 白 共 包含 5 个 保守 区 域 ( I 
~V) URTIA FRF AR IM V 的 两 个 天 冬 氨 酸 富 集 区 域 (DDXXD，X 为 任意 氨基 酸 ): 
FARM (First Aspartic Rich Моб?) SARM (Second Aspartic Rich Motif), 如 图 5 所 示 。 DsFPPS1 
蛋白 和 DsFPPS2 蛋白 均 属 于 FPPS 家 族 , 序列 比 对 结果 显示 DsFPPS1 蛋白 和 DsFPPS2 蛋白 


H 
已 


具有 60.53% 的 相似 性 ， 均 具有 FPPS 家 族 和 蛋白 特征 的 两 个 天 冬 氨 酸 富 集 区 域 FARM 和 
SARM， 以 及 序列 保守 区 域 1~V 。 天 冬 氨 酸 富 集 区 域 (DDXXD) 是 金属 离子 Mg” 结 合 位 点 ， 
Mg 再 与 底 物 的 磷酸 基 团 结合 ， 从 而 发 挥 催化 作用 (Christianson 2017). DsFPPS1 蛋白 对 应 
的 五 个 保守 区 域 序列 分 别 为 GGKLNR (45-50, 1). EWLQAYFLVLDDIMDNSHTRRG 
(83~104 ， H ) . GQMIDL (160-155, Ш). KT (190-191, №). 

GIYFQVQDDYLDCFGDPEFIGKIGTDIEDFK (225-255, V), FARM 为 DDIMD (93-97), 

SARM 为 DDYLD (232-236). DsFPPS2 蛋白 对 应 的 五 个 保守 区 域 分 别 为 : SRKLNR (25-30, 
I)、QWLVGCVLVLDDLLDASHTRRG (63-84, П). GEMIDL (140-145, Ш). КТ(170-171, 


ІП 
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IV). GIYFQAQDDYLDCFGDPKKSGKIGSDIEDFK (205-235, V), FARM 为 DDLLD 
(73~77)，SARM 为 DDYLD (212-216). 
| А А I SY | E | Nra | та 1 
DsFPPS1 MSDLRSKFLEVYQVLKSELLNDPAFEWTHTSRQWVDRMLDYN - -VPGGKLNRGLSVIDS 
DsFPPS2 ------------------ MTMSP---VSGSTRCWITMFQEVRSTLSRKLNRGLSVIET 
CqFPPS MSDLRSKFLEVYQILKSELLNDPAFEWTDTSRQWVDRMLDYN -VPGGKLNRGLSVIDS 
CsFPPS MTDLKSKFLEVYSVLKSELLHDSAFEFTDDSRQWVDRMLDYN -VPGGKLNRGLSVIDS 
MiFPPS MSDLKSKFVEVYNILKQELLNDPAFEFTDVSRQWVERMLDYN-VPGGKLNRGLSVVDS 
GuFPPS MADLKSTFLNVYSVLKSELLHDPAFEWSDDSRQWADRMLDYN - VPGGKLNRGLSVIDS 
RcFPPS MADLKSTFLNVYSILKKQLLEDPAFEWTPDSREWVNRMLDYN-VPGGKLNRGLSVIDS 
MsFPPS MADLKSTFLNVYSVLKSELLHDPAFEWSEDSRQWVDRMLDYN -VPGGKLNRGLSVIDS 
AmFPPS MADLKSTFLNVYSVLKSELLHDPAFEWSDDSRQAWVDRMLDYN-VPGGKLNRGLSVIDS 
PgFPPS MSDLKTRFLEVYSVLKSELLNDPAFEFTDDSRQAWVERMLDYN-VPGGKLNRGLSVIDS 
A B I 
I Т I T | Т ШІ ТТР: г. Т 
DsFPPS1 LLKEGEELTDDEIFLASALGWCIEWLQAYFLVL IMDNSHTRRGQPCWFRVPKVGLI 
DsFPPS2 LLNDAKQLTEDQLFRACAVGWCIQWLVGCVLVL LLDASHTRRGRPCWFRLPKVGMI 
CqFPPS LLKEGEELTEDEIFLASALGWCIEWLQAYFLVL IMDNSHTRRGQPCWFRVPKVGMI 
CsFPPS LLKEGKELTDDEVFLACALGWCIEWLQAYFLVL IMDSSHTRRGQPCWFRKPKVGMI 
MiFPPS LLKEGEELTDDEIFLSSALGWCIEWLQAYFLVL IMDGSHTRRGQPCWFRRPKIGMI 
GuFPPS LLKEGQALNDDELFLASALGWCIEWLQAYFLVL IMDNSHTRRGQPCWFRVPKVGMI 
RcFPPS LLKEGQELTEEEIFLASALGWCIEWLQAYFLVL IMDGSHTRRGQPCWFRVPKVGMI 
MsFPPS LLKEGQALNDDEIFQASALGWCIEWLQAYFLVL IMDNSHTRRGQPCWFRVPKVGMI 
AmFPPS LLKEGEELNDDEIFLASALGWCIEWLQAYFLVL І MDNSHTRRGQPCWFRVPKVGMI 
PgFPPS LLKEGKELSDDEIFLSSALGWCIEWLQAYFLVL MDISSHTRRGQPCWFRLPKVGMI 
工 
D 
| T | 140 | T | T | | 
DsFPPS1 NDGIILRNQIPRILRKHFRGKKYYVDLLDLFNEVEFQTASGQMIDL ITTIEGEKDLSK 
DsFPPS2 NDGILLWNHIHRILRKHFREQPYYVDLLDLFNQVEFQTACGEMIDLLTAFDGENDLLK 
CqFPPS NDGIILRNQIPRILRKHFRDKKYYVDLLDLFNEVEFQTASGQMIDL ITTIEGEKDLSK 
CsFPPS NDGIILRNHIPRILKKHFRGKPYYVDLLDLFNEVEFQTACGQMIDLITTLEGEKDLSK 
MiFPPS NDGIILRNHIPRILKKHFRGKPYYVDLLDLFNEVEFQTASGQMIDLITTIEGEKDLTK 
GuFPPS NDGVLLRNHIPRILRKHFRGKPYYVDLLDLFNEVEFQTASGQMIDLITTLEGEKDLSK 
RcFPPS NDGVLLRNHIPRILKNHFRGKAYYVDLLDLFNEVEFQTASGQMIDLITTLEGEKDLSK 
MsFPPS NDGVLLRNHIPRILRKHFKGKPYYVELLDLFNEVEFQTAAGQMIDLITTLEGEKDLSK 
AmFPPS NDGVLLRNHIPRILKKHFRGKPYYVDLVDLFNEVEFQTASGQMIDL ITTLEGEKDLSK 
PgFPPS NDGILLRNHIPRILKKHFRQAKPYYVDLLDLFNEVEFQTASGQMIDLITTLVGEKDLSK 
E F Ш 
| 4 l 29 І T I T l 
DsFPPS1 LDLHRRIVQYKTAYYSFYISVACALLMSGEKLEDHDDVKNILIDMGIYF с 
DsFPPS2 PALHQCISQYKTAYGTFYLPFACALLILGEKLDDYNDVKDILLGMGIYF C 
CqFPPS LDLHRRIVQYKTAYYSFYISVACALLMSGEKLEDHENVKDILINMGIYF с 
CsFPPS LPLHHRIVQYKTAYYSFYLPVACALLMSGEDLENHNDVKNVL IEMGTYF C 
MiFPPS LPLHCQIVQYKTAYYSFYLPVACALLMAGKNLDDHIDVKNILIEMGIYF с 
СиЕРР5 LSLHRRIVQYKTAYYSFYLPVACALLMMGENLDNH IDVKNILVDMGTYEF е 
КсЕРР5 LSLHRRIVQYKTAYYSFYLPVACALLMAGENLDDH IDVKNILVDMGIYFE C 
MsFPPS LSLHRRIVQYKTAYYSFYLPVACALLMAGEDLDNHVDVKNILVEMGTYF C 
AmFPPS LSLHRRIVQYKTAYYSFYLPVACALLMVGENLDNHVDVKNILVEMGTYF C 
PgFPPS LPIHRRIVQYKTAYYSFYLPVACALLMSGEDLEKHTNVKDILIEMGTYF C 
IV H 
G 
| 29 | ар | 270 T. | 
DsFPPS1 DPEFIGKIGTDIEDFKCSWLVVKALELCNNEQKQVLYENYGKEDPACVARVKELYNVL 
DsFPPS2 DPKKSGKIGSDIEDFKCSWLVVKALEVCSEEQKKLLCDNYGKADPANVALVKSLYEDL 
CqFPPS DPEFIGKIGTDIEDFKCSWLVVKALELCNDEQKKVLHENYGKEDPACVARVKELYNVL 
CsFPPS APEVIGKIGTDIEDFKCSWLVVKAMELSNDEQKKFLKENYGKADPTCVAKVKELYNAL 
MiFPPS TPEVIGKIGTDIEDFKCSWLVVKAMERCNEEQKKLLIENYGKADPACVAKVKELYNTI 
GuFPPS DPQTIGKIGTDIEDFKCSWLVVKALELCNEEQKKVLYEHYGKPDPTNVAKVKALYNEL 
RcFPPS DPKTIGKIGTDIEDFKCSWLVVKALELCNDEQKKVLHENYGKADPECVTKVKVLYNEL 
MsFPPS DPETIGKIGTDIEDFKCSWVVVKALELCNEEQKKVLHENYGKPDPANVAIVKTLYNEL 
AmFPPS DPQTIGKIGTDIEDYKCSWLAVKAVELSNEEQKKLLYENYGKPDPANVAKVKALYDEL 
PgFPPS APEVIGKIGTDIEDFKCSWLVVKALELSNEEQKKFLHENYGKDDPASVAKVKELYNTL 
а-2 a-3 
МАРР, PEETERS AILEE EE ТП EEEE 
DsFPPS1 QAAFADYESKSYEKLIESIEAHPSTAVQAVLKSFLAKIYKRQK 
DsFPPS2 QGIFAKYEIDEYEKLLVSIEALPSKSVQAVLKSYLGKIYKRQK 
CqFPPS QGAFADFESTSYENLITSIESHPNKAVQAVLKSFLAKIYKRQK 
CsFPPS QGAFEEYESKSYEKLINSIEAHPSKAVQAVLKSFLAKIYKRQK 
MiFPPS QGAFAEYESASYERLIKSIEAHPNKAIQALLKSFLAKIYKRQK 
GuFPPS QGVFAEYESASYEKLVTSIEAHPSKAVQSVLKSFLAKIYKRQK 
RcFPPS QGVFTDYENKSYEKLVTSIEAHPSKAVQAVLKSFLAKIYKRQK 
MsFPPS EGAFAEYESASYEKLVTSIEAHPSSAVQAVLKSFLAKIYKRQK 
AmFPPS QGVFAEYESTSYEKLVSSIEAHPSKAVQAVLKSFLAKIYKRQK 
PgFPPS QDVFAEYESKSYDKLIKFIEAHPSQAVQAVLKSFLGKIYKRQK 
I š 


ChinaXiv 合 作 


5 FPPS 和 蛋白 多 序列 比 对 分 析 
Fig. 5 Multiple sequence alignment of FPPS protein 


2.5 DsFPPS 蛋白 的 结构 特 和 


E 分 析 


使 用 SOPMA 在 线 软件 对 DsFPPS 基因 所 编码 蛋白 的 二 


结构 进行 分 析 和 预测 , 结 


Ш 


明 ( 图 6) DsFPPS1 蛋白 和 DsFPPS2 1. 都 是 主要 有 a- 螺 旋 组 成 ， 
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例 分 别 为 59.36%#ll 64.29%， 此 外 ，DsFPPS1 蛋白 的 二 级 结构 还 由 19.88% 的 无 规则 卷曲 、 
11.70% 的 延伸 链 以 及 9.06% 的 B- 转 角 组 成 ，DsFPPS2 蛋白 的 二 级 结构 还 由 15.53% 的 无 规则 
卷曲 、10.87% 的 延伸 链 以 及 9.32% 的 B- 转 角 组 成 。 
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È: 蓝 色 为 a -螺旋 ; 红色 为 延伸 链 ; 绿色 为 B -转角 ; 紫色 为 无 规则 卷曲 。 
Note: Blue lines represented a-helix; Кей lines represented extended strand; Green lines represented B-turn; 


Purple lines represented random coil. 


6 DsFPPS1 蛋白 (А) 和 DsFPPS2 ЕҢ (В) 的 二 级 结构 分 析 
Fig. 6 Secondary structure prediction of DSFPPS1 (А) апа DSFPPS2 (В) protein 


蛋白 质 的 空间 构象 是 蛋白 质 发 挥 功能 的 重要 结构 ， 因 此 ， 我 们 利用 在 线 软 件 Phyre2 对 
DsFPPS 基因 所 编码 的 DsFPPS1 蛋白 和 DsFPPS2 蛋白 的 三 级 结构 进行 预测 ， 以 Artemisia 
spiciformis 的 FPPS 和 蛋白 PDB ID: 4KK2) 为 模板 ， 采 用 线 串 法 同 源 建 模 构 建 DsFPPS1 蛋白 
(79% 相 似 性 ) 和 DsFPPS2 蛋白 (63% 相 似 性 ) 的 三 级 结构 ， 结 果 如 图 7 所 示 。 与 大 多 数 的 FPPS 
蛋白 类 似 , DsFPPS1 蛋白 的 空间 结构 中 总 共 包 含有 13 个 o- 螺 旋 , 其 中 有 10 个 长 o- 螺 旋 (A~ 了 JJ)， 
o- 螺 旋 A 和 ao- 螺旋 В 形成 一 个 发 夹 结构 ,a- 螺 旋 С Жо-Ш АЕ J JE 8 个 w- 螺 旋 则 形成 -螺旋 束 ， 
弹 绕 形成 一 个 中 央 腔 ;此 外 还 包含 有 3 个 小 -螺旋 (o-1，o-2，o-3)， 藤 入 到 ao- 螺旋 H 和 o- 螺 
旋 I1 之 间 ， 酶 的 催化 反应 则 发 生 在 a- 螺 旋 腔 底 。DsFPPS2 蛋白 的 三 级 结构 与 DsFPPS1 蛋白 
ЖЫ, 但 只 包含 有 12 个 ao- 螺 旋 ，9 个 长 ao- 螺旋 (B~) 和 3 个 小 a- 螺 旋 (a-1，a-2，o-3)， 不 包含 
a- 螺旋 A， 因 此 缺少 a- 螺 旋 A 和 a- 螺 旋 B 形成 的 发 夹 结构 。 


7 DsFPPS1 ЖА (А) 和 DsFPPS2 ЕҢ (В) 的 三 级 结构 模型 预测 
Fig. 7 Tertiary structure of DsFPPS1 (А) апа DsFPPS2 (В) protein 
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2.6 DsFPPS 蛋白 的 系统 进化 分 析 
采用 本 地 软件 MEGA 7.0.14 对 DsFPPS1 和 蛋白、DsFPPS2 蛋白 和 来 自 于 GenBank 数据 库 
的 24 Ж FPPS 和 蛋白 序列 进行 分 子 系统 进化 分 析 ，N-J 法 (Neighbor-joining) 构 建 系 统 进 化 树 。 
结果 表明 (图 8), FPPS 和 蛋白 的 系统 进化 树 聚 类 分 为 植物 、 真 菌 、 动 物 和 细菌 4 个 类 群 ， 具 有 
较 显 著 的 种 族 特异 性 。 细 菌 单独 聚 为 一 大 枝 ， 动 物 、 真 菌 和 植物 聚 为 一 大 校 ， 该 分 枝 中 植物 
单独 聚 为 一 枝 ， 另 一 枝 又 分 化 为 动物 和 真菌 两 大 枝 。 在 植物 分 校 中 ， 层 形 科 、 五 加 科 、 蔡 科 、 
WEEER KAREHA ARN H WERN DsFPPS1 ҰН ЖИЕ, 
说 明 其 与 理科 植物 的 亲缘 关系 较 近 ， 而 菊 叶 香 理 的 DsFPPS2 和 蛋白 单独 聚 为 一 枝 。 
69 SolFPPS (AQY54371.1) 


73 SmFPPS (ABV08819.1) 
SA 
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8 FPPS 蛋白 系统 进化 树 
Fig. 8 Phylogenetic tree of FPPS proteins 


. 结论 与 讨论 


倍 半 昔 类 化 合 物 作为 植物 的 次 级 代谢 产物 具有 较 强 的 生物 活性 ( 朴 英 花 , 2012)， 例 如 青 
A (Artemisinin, ClsH22O5) 为 倍 半 熙 内 酯 药物 ， 是 有 效 的 抗 疙 疾 特效 药 (Tu 2011); 吉 马 酮 
(Germacrone, CisH2z2O) 具 有 抗 泪 疡 、 抗 肿瘤 、 抗 炎 、 抗 菌 、 止 咳 、 利 胆 等 多 种 功效 (Wu, 2017); 
B- 校 叶 醇 (B-Eudesmol, CisH26O) 可 通过 作用 于 瞬 态 受 体 电 位 锚 蛋 白 1 (TRPA1) 和 自主 神经 系 
统 从 而 刺激 食欲 (Ohara, 2017); 雪松 醇 (Cedrol C1;5H26O) 可 剂量 依赖 性 地 加 速 纤维 母 细胞 生长 
以 及 增加 1 型 胶原 蛋白 和 弹性 蛋白 的 生成 (Mu, 2012); 缴 草 烯 酸 (Valerenic acid, ClsH22O7?) 可 
变 构 调 节 GABA-A 受 体 从 而 发 挥 抗 焦虑 活性 (Becker, 2014)。 

FPPS 是 植物 藻类 化 合 物 生 物 合成 途径 中 分 支点 上 的 关键 酶 ， 经 FPPS 的 催化 可 生产 倍 
半 茧 类 化 合 物 的 前 体 ， 菊 叶 香 蔡 精 油 中 倍 半 昔 类 的 生物 合成 需要 此 酶 的 参与 。 目 前 ， 随 着 转 
录 组 学 研究 的 崛起 ,我 们 从 包含 有 海量 信息 的 转录 组 数据 中 挖掘 FPPS 候选 基因 ， 获 得 了 两 


条 FPPS 基因 : ЕРР81 和 FPPS2, 并 对 这 两 条 基因 的 开放 阅读 框 进行 了 预测 并 进行 了 进一步 
的 生物 信息 学 分 析 , 结果 显示 ,FPPS1 蛋白 和 FPPS2 蛋白 序列 相似 度 达 60.53%, 均 含 有 FPPS 
蛋白 特征 的 5 个 保守 结构 域 (I 保守 ) 以 及 两 个 天 冬 氨 酸 富 集 区 域 (FARM 和 SARM)。 然 而 ， 
FPPS1 蛋白 和 FPPS2 蛋白 的 稳定 性 存在 差异 ，FPPS2 蛋白 为 不 稳定 蛋白 ， 且 FPPS2 ЕҢ 
构 中 缺少 -螺旋 A, 因此 其 三 级 结构 中 缺少 由 w- 螺 旋 A 和 ao- 螺旋 B 组 成 的 发 夹 结构 ,该 结构 
可 能 会 影响 其 稳定 性 。 在 分 子 进化 分 析 树 的 植物 分 枝 中 ，FPPS2 蛋白 与 其 他 植物 分 开 ， 单 独 
聚 为 一 枝 ，FPPS2 蛋白 可 能 是 一 类 新 的 FPPS 亚 型 。 植 物 FPPS 通常 由 多 基因 家 族 编码 ， 含 
有 多 个 FPPS 亚 型 ， 不 同 的 亚 型 在 植物 不 同 的 生长 阶段 和 组 织 中 发 挥 作用 ， 拟 南 芥 种 子 中 
FPS2 的 缺失 可 升 高 HMGR(3-hydroxy-3-methylglutaryl CoA reductase，3- 羟 基 -3- 甲 基 成 二 酰 
CoA 还 原 酶 ) 活 性 (Closa, 2010)， 从 而 调节 植物 中 “ 碳 流 ” 的 流向 ， 控 制 类 异 戊 三 烯 种 类 的 比 
例 。 


在 前 期 的 菊 叶 香 莹 转录 组 研究 中 发 现 ，FPPS7 在 花 和 叶 组 织 中 的 表达 均 高 于 ЕРР52, 
且 FPPS1 Æ KATERE Г ЕРР52 和 蛋白， 由 此 推测 FPPS1 蛋白 广泛 且 长 期 存在 于 菊 叶 香 蔡 
植物 中 ， 而 FPPS2 的 出 现 则 有 具有 “时 - 空 ”特异 性 ， 但 菊 叶 香 荧 FPPS 各 亚 型 的 功能 、 活 性 、 
表达 以 及 调节 机 制 仍 需 要 更 进一步 的 研究 。 总 的 来 说 , 该 研究 对 菊 叶 香 蒙 转录 组 数据 库 中 的 
FPPS 基因 进行 了 挖掘 与 生物 信息 学 分 析 ， 为 菊 叶 香 蔡 FPPS 基因 今后 的 基础 研究 和 开发 应 
用 奠定 了 理论 基础 。 
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